智能论文笔记

Training Algorithm Matters for the Performance of Neural Network Potential: A Case Study of Adam and the Kalman Filter Optimizers

Yunqi Shao , Florian M. Dietrich , Carl Nettelblad , Chao Zhang

分类：机器学习

2021-09-08

开发神经网络电位（NNPS）的一个隐藏但重要的问题是培训算法的选择。在这里，我们使用Photl-Parrinello神经网络（BPNN）和两个可公开可访问的液体数据集进行比较两个流行训练算法，自适应力矩估计算法（ADAM）和扩展卡尔曼滤波算法（EKF）的性能。natl。阿卡。SCI。U.S.A. 2016,113,8368-8373和Proc。natl。阿卡。SCI。U.S.A. 2019,116,1110-1115]。这是通过在Tensorflow中实施EKF来实现的。结果发现，与ADAM相比，用EKF培训的NNP对学习率的价值更为可转让和更敏感。在这两种情况下，验证集的错误指标并不总是作为NNP的实际性能的良好指标。相反，我们表明它们的性能很好地与基于Fisher信息的相似度措施相互作用。

translated by 谷歌翻译

Monte-Carlo Tree-Search for Leveraging Performance of Blackbox Job-Shop Scheduling Heuristics

Florian Wimmenauer , Matúš Mihalák , Mark H. M. Winands

分类：人工智能

2022-12-14

In manufacturing, the production is often done on out-of-the-shelf manufacturing lines, whose underlying scheduling heuristics are not known due to the intellectual property. We consider such a setting with a black-box job-shop system and an unknown scheduling heuristic that, for a given permutation of jobs, schedules the jobs for the black-box job-shop with the goal of minimizing the makespan. Here, the jobs need to enter the job-shop in the given order of the permutation, but may take different paths within the job shop, which depends on the black-box heuristic. The performance of the black-box heuristic depends on the order of the jobs, and the natural problem for the manufacturer is to find an optimum ordering of the jobs. Facing a real-world scenario as described above, we engineer the Monte-Carlo tree-search for finding a close-to-optimum ordering of jobs. To cope with a large solutions-space in planning scenarios, a hierarchical Monte-Carlo tree search (H-MCTS) is proposed based on abstraction of jobs. On synthetic and real-life problems, H-MCTS with integrated abstraction significantly outperforms pure heuristic-based techniques as well as other Monte-Carlo search variants. We furthermore show that, by modifying the evaluation metric in H-MCTS, it is possible to achieve other optimization objectives than what the scheduling heuristics are designed for -- e.g., minimizing the total completion time instead of the makespan. Our experimental observations have been also validated in real-life cases, and our H-MCTS approach has been implemented in a production plant's controller.

translated by 谷歌翻译

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

Integrating Form and Meaning: A Multi-Task Learning Model for Acoustic Word Embeddings

Badr M. Abdullah , Bernd Möbius , Dietrich Klakow

分类：自然语言处理

2022-09-14

声词嵌入（AWES）的模型学会将可变长度的口语段映射到固定差异矢量表示上，以便在嵌入空间附近预计，同一单词的不同声学示例。除了他们的语音技术应用外，AWE模型还显示出可以预测各种听觉词汇处理任务的人类绩效。当前的敬畏模型基于神经网络，并以自下而上的方法进行了培训，该方法集成了声音提示，以构建给定声或符号监督信号的单词表示。因此，这些模型在学习过程中不会利用或捕获高级词汇知识。％并捕获有关单词形式的低级信息。在本文中，我们提出了一个多任务学习模型，该模型将自上而下的词汇知识纳入了敬畏的训练程序中。我们的模型学习了声学输入和词汇表示之间的映射，该表示除了基于自下而上的表单监督外，还编码了高级信息，例如单词语义。我们尝试三种语言，并证明合并词汇知识可以改善嵌入空间的可区分性，并鼓励模型更好地分开词汇类别。

translated by 谷歌翻译

Where is VALDO? VAscular Lesions Detection and segmentatiOn challenge at MICCAI 2021

Carole H. Sudre , Kimberlin Van Wijnen , Florian Dubost , Hieab Adams , David Atkinson , Frederik Barkhof , Mahlet A. Birhanu , Esther E. Bron , Robin Camarasa , Nish Chaturvedi

分类：计算机视觉 | 人工智能

2022-08-15

脑小血管疾病的成像标记提供了有关脑部健康的宝贵信息，但是它们的手动评估既耗时又受到实质性内部和间际变异性的阻碍。自动化评级可能受益于生物医学研究以及临床评估，但是现有算法的诊断可靠性尚不清楚。在这里，我们介绍了\ textIt {血管病变检测和分割}（\ textit {v textit {where valdo？}）挑战，该挑战是在国际医学图像计算和计算机辅助干预措施（MICCAI）的卫星事件中运行的挑战（MICCAI） 2021.这一挑战旨在促进大脑小血管疾病的小而稀疏成像标记的自动检测和分割方法的开发，即周围空间扩大（EPVS）（任务1），脑微粒（任务2）和预先塑造的鞋类血管起源（任务3），同时利用弱和嘈杂的标签。总体而言，有12个团队参与了针对一个或多个任务的解决方案的挑战（任务1 -EPVS 4，任务2 -Microbleeds的9个，任务3 -lacunes的6个）。多方数据都用于培训和评估。结果表明，整个团队和跨任务的性能都有很大的差异，对于任务1- EPV和任务2-微型微型且对任务3 -lacunes尚无实际的结果，其结果尤其有望。它还强调了可能阻止个人级别使用的情况的性能不一致，同时仍证明在人群层面上有用。

translated by 谷歌翻译

Tractable Dendritic RNNs for Reconstructing Nonlinear Dynamical Systems

Manuel Brenner , Florian Hess , Jonas M. Mikhaeil , Leonard Bereska , Zahra Monfared , Po-Chen Kuo , Daniel Durstewitz

分类：机器学习

2022-07-06

在许多科学学科中，我们有兴趣推断一组观察到的时间序列的非线性动力学系统，这是面对混乱的行为和噪音，这是一项艰巨的任务。以前的深度学习方法实现了这一目标，通常缺乏解释性和障碍。尤其是，即使基本动力学生存在较低维的多种多样的情况下，忠实嵌入通常需要的高维潜在空间也会阻碍理论分析。在树突计算的新兴原则的推动下，我们通过线性样条基础扩展增强了动态解释和数学可牵引的分段线性（PL）复发性神经网络（RNN）。我们表明，这种方法保留了简单PLRNN的所有理论上吸引人的特性，但在相对较低的尺寸中提高了其近似任意非线性动态系统的能力。我们采用两个框架来训练该系统，一个将反向传播的时间（BPTT）与教师强迫结合在一起，另一个将基于快速可扩展的变异推理的基础。我们表明，树枝状扩展的PLRNN可以在各种动力学系统基准上获得更少的参数和尺寸，并与其他方法进行比较，同时保留了可拖动和可解释的结构。

translated by 谷歌翻译

Exploring Event Camera-based Odometry for Planetary Robots

Florian Mahlknecht , Daniel Gehrig , Jeremy Nash , Friedrich M. Rockenbauer , Benjamin Morrell , Jeff Delaune , Davide Scaramuzza

分类：计算机视觉 | 机器人

2022-04-12

由于它们对运动模糊和在弱光和高动态范围条件下的高度鲁棒性的韧性，事件摄像机有望成为对未来火星直升机任务的基于视觉探索的传感器。但是，现有的基于事件的视觉惯性进程（VIO）算法要么患有高跟踪误差，要么是脆弱的，因为它们无法应对由于无法预料的跟踪损失或其他效果而导致的显着深度不确定性。在这项工作中，我们介绍了EKLT-VIO，该工作通过将基于事件的最新前端与基于过滤器的后端相结合来解决这两种限制。这使得不确定性的准确和强大，超过了基于事件和基于框架的VIO算法在挑战性基准上的算法32％。此外，我们在悬停的条件（胜过现有事件的方法）以及新近收集的类似火星和高动态范围的新序列中表现出准确的性能，而现有的基于框架的方法失败了。在此过程中，我们表明基于事件的VIO是基于视觉的火星探索的前进道路。

translated by 谷歌翻译

View-Consistent Metal Segmentation in the Projection Domain for Metal Artifact Reduction in CBCT -- An Investigation of Potential Improvement

Tristan M. Gottschalk , Andreas Maier , Florian Kordon , Björn W. Kreher

分类：计算机视觉

2021-12-03

创伤干预的阳性结果取决于插入的金属植入物的术中评价。由于金属伪影，该评估的质量大大取决于所谓的金属伪影减少方法（MAR）的性能。这些MAR方法中的大多数需要先前的插入金属物体分割。因此，尽管存在一些主要缺点，但是，施加在重建的3D体积中的基于基于阈值的分割方法的通常。利用本出版物，研究了将分割任务转移到基于学习的基于学习的视图 - 一致的2D投影的方法的可能性。为了分割本金属，研究了使用在CADaVer研究期间获得的真实数据进行培训的基于基于学习的2D投影明智的分割网络。为了克服与2D投影明智分割的缺点，提出了一种一致性滤波器。通过使用新的分段掩码将标准FSMAR的结果与修改后的FSMAR版本进行比较，研究了移位分割域的影响。对真实尸体数据进行定量和定性评估，调查方法显示了MAR性能增加和对金属伪影的不敏感性。对于重建外部的金属外部的金属或消失金属外壳的情况，可以显示伪影的显着降低。因此，增加到大约3 dB w.r.t.实现了所有切片的平均PSNR度量，单切片最多9 dB。所示结果揭示了转变对基于2D的分段方法的有益影响，以便使用MAS方法的下游使用的真实数据。

translated by 谷歌翻译

When are Deep Networks really better than Decision Forests at small sample sizes, and how?

Haoyin Xu , Kaleab A. Kinfu , Will LeVine , Sambit Panda , Jayanta Dey , Michael Ainsworth , Yu-Chung Peng , Madi Kusmanov , Florian Engert , Christopher M. White

分类：机器学习 | 人工智能 | (统计)机器学习

2021-08-31

深度网络和决策林（如随机森林和渐变升级树）分别是用于结构化和表格数据的主要机器学习方法。许多论文在一个或两个不同的域（例如，在100个不同的表格数据设置上）经验上比较了大量分类器（例如，在100个不同的表格数据设置）上。然而，使用最具当代最佳实践的仔细概念和经验比较这两种策略尚未进行。概念上，我们说明两者都可以盈利地被视为“分区和投票”方案。具体地，他们俩学习的表示空间是将特征空间分区到凸多台的联合中。对于推理，每个都决定从激活节点的投票。该配方允许统一对这些方法之间关系的基本理解。凭经验，我们对数百个表格数据设置以及多个视觉和听觉设置进行比较这两种策略。我们的重点是在大多数10,000个样本的数据集上，它代表了大部分科学和生物医学数据集。一般而言，我们发现森林在表格和结构化数据（视觉和试镜）上以小样本尺寸的表现，而深网络在具有较大样本尺寸的结构化数据上更好地进行。这表明可以通过进一步结合森林和网络的进一步结合来实现两种情况的进一步提升。我们将继续在未来几个月内修改此技术报告，并更新结果。

translated by 谷歌翻译

Reproducible radiomics through automated machine learning validated on twelve clinical applications

Martijn P. A. Starmans , Sebastian R. van der Voort , Thomas Phil , Milea J. M. Timbergen , Melissa Vos , Guillaume A. Padmos , Wouter Kessels , David Hanff , Dirk J. Grunhagen , Cornelis Verhoef

分类：计算机视觉

2021-08-19

放射线学使用定量医学成像特征来预测临床结果。目前，在新的临床应用中，必须通过启发式试验和纠正过程手动完成各种可用选项的最佳放射组方法。在这项研究中，我们提出了一个框架，以自动优化每个应用程序的放射线工作流程的构建。为此，我们将放射线学作为模块化工作流程，并为每个组件包含大量的常见算法。为了优化每个应用程序的工作流程，我们使用随机搜索和结合使用自动化机器学习。我们在十二个不同的临床应用中评估我们的方法，从而在曲线下导致以下区域：1）脂肪肉瘤（0.83）； 2）脱粘型纤维瘤病（0.82）; 3）原发性肝肿瘤（0.80）; 4）胃肠道肿瘤（0.77）； 5）结直肠肝转移（0.61）; 6）黑色素瘤转移（0.45）; 7）肝细胞癌（0.75）; 8）肠系膜纤维化（0.80）; 9）前列腺癌（0.72）； 10）神经胶质瘤（0.71）; 11）阿尔茨海默氏病（0.87）;和12）头颈癌（0.84）。我们表明，我们的框架具有比较人类专家的竞争性能，优于放射线基线，并且表现相似或优于贝叶斯优化和更高级的合奏方法。最后，我们的方法完全自动优化了放射线工作流的构建，从而简化了在新应用程序中对放射线生物标志物的搜索。为了促进可重复性和未来的研究，我们公开发布了六个数据集，框架的软件实施以及重现这项研究的代码。

translated by 谷歌翻译